Amazon QuickSight チュートリアル実践:データベースデータ(Amazon Redshift)を使って分析を作成
Amazon QuickSightのドキュメントには『チュートリアル』という形でデータセットや分析を作成する手順が豊富に用意されています。サービスの内容、機能の概要を把握するのであればまずは触ってみるのが一番!という事でこの部分についてもガンガン進めていきたいと思います。4つめのチュートリアルはデータベースデータを使った内容となります。Amaozn Redshiftを使い、自動検知ありver.と無しver.について言及しています。
可視化に用いるデータを準備
まずはAmazon Redshiftのデータを用意。任意のAWSアカウント上、バージニアリージョンにAmazon Redshiftクラスタを構築、データを投入してアクセス出来るようにしておきます。アクセス制限周りの設定については下記エントリをご参照ください。
サンプルデータについてはこれまでにも過去使用してきたTableauのサンプルデータ、superstoreのデータを使いたいと思います。
# SELECT COUNT(*) FROM public.orders; count ------- 8369 (1 row) # SELECT * FROM public.orders LIMIT 10; order_id | order_date | priority | quantity | sales | discount_rate | ship_mode | profit | unit_price | ad_expenses | shipping_cost | customer_name | prefecture | city | area | shop_name | customer_segment | product_category | product_sub_category | product_id | product_name | product_description | product_container | base_margin | supplier | deliver_date | ship_date ----------+------------+----------+----------+--------+---------------+------------+--------+------------+-------------+---------------+---------------+------------+--------+------+-----------+------------------+------------------+-------------------------------------+------------+---------------------------------------------+-------------------------------------------------------------------------------------------------+-------------------+-------------+---------------+--------------+------------ 35 | 2010-06-19 | 指定なし | 14 | 236606 | 0.01 | 通常航空便 | 4898 | 15599 | 232434 | 899 | 石坂 尚昭 | 大阪 | 東大阪 | 関西 | Hayes | 企業 | テクノロジー | 電話と通信 | P331 | CF 688 | This is the field which has product description for CF 688 | 小型ボックス | 0.58 | Ningbo | 2011-10-25 | 2011-10-25 35 | 2010-10-14 | 指定なし | 30 | 36070 | 0.03 | 通常航空便 | 6072 | 911 | 215258 | 225 | 石坂 尚昭 | 奈良 | 生駒 | 関西 | Hayes | 企業 | 事務用品 | ペンと画材 | P385 | Dixon Ticonderoga Core-Lock Colored Pencils | This is the field which has product description for Dixon Ticonderoga Core-Lock Colored Pencils | ラップバッグ | 0.52 | Dalian | 2011-10-24 | 2011-10-26 35 | 2010-12-21 | 指定なし | 30 | 36070 | 0.03 | 通常航空便 | 6072 | 911 | 105811 | 225 | 石坂 尚昭 | 長崎 | 松浦 | 九州 | Hayes | 企業 | 事務用品 | ペンと画材 | P385 | Dixon Ticonderoga Core-Lock Colored Pencils | This is the field which has product description for Dixon Ticonderoga Core-Lock Colored Pencils | ラップバッグ | 0.52 | Argot | 2011-10-24 | 2011-10-26 35 | 2012-03-05 | 指定なし | 14 | 236606 | 0.01 | 通常航空便 | 4898 | 15599 | 121076 | 899 | 石坂 尚昭 | 大阪 :::::::::::::: | 2011-10-25 | 2011-10-24 66 | 2011-05-19 | 低 | 41 | 13518 | 0.09 | 通常航空便 | 757 | 288 | 456140 | 70 | 児島 弘和 | 福岡 | 筑紫野 | 九州 | Hill | 消費者 | 事務用品 | ペンと画材 | P807 | Newell 340 | This is the field which has product description for Newell 340 | ラップバッグ | 0.56 | Alibaba | 2009-01-20 | 2009-01-19 66 | 2011-05-19 | 低 | 41 | 13518 | 0.09 | 通常航空便 | 757 | 288 | 242527 | 70 | 児島 弘和 | 愛知 | 江南 | 中部 | Hill | 消費者 | 事務用品 | ペンと画材 | P807 | Newell 340 | This is the field which has product description for Newell 340 | ラップバッグ | 0.56 | Merxin | 2009-01-20 | 2009-01-22 197 | 2009-01-14 | 高 | 23 | 38815 | 0.01 | 通常航空便 | 3322 | 1298 | 278978 | 314 | 柏木 道生 | 茨城 | 古河 | 関東 | Bryant | ホームオフィス | 事務用品 | はさみ、定規、カッター | P124 | Acme 8 Straight Scissors | This is the field which has product description for Acme 8 Straight Scissors | 小型パック | 0.6 | Dalian | 2011-04-09 | 2011-04-10 197 | 2009-01-14 | 高 | 23 | 38815 | 0.01 | 通常航空便 | 3322 | 1298 | 339141 | 314 | 柏木 道生 | 愛知 | 名古屋 | 中部 | Bryant | ホームオフィス | 事務用品 | はさみ、定規、カッター | P124 | Acme 8 Straight Scissors | This is the field which has product description for Acme 8 Straight Scissors | 小型パック | 0.6 | Global Source | 2011-04-09 | 2011-04-10 229 | 2010-07-07 | 重要 | 43 | 73263 | 0.11 | 通常航空便 | 9844 | 1264 | 137557 | 498 | 大泉 修平 | 大阪 | 松原 | 関西 | Cement | 消費者 | 家具 | オフィス家具 | P818 | Nu-Dell Executive Frame | This is the field which has product description for Nu-Dell Executive Frame | 小型パック | 0.48 | Elan | 2010-12-31 | 2011-01-01 229 | 2010-09-21 | 重要 | 24 | 74887 | 0.02 | 通常航空便 | 381 | 2492 | 238026 | 1298 | 植田 道子 | 兵庫 | 西宮 |s | This is the field which has product description for GBC Standard Therm-A-Bind Covers | 小型ボックス | 0.39 | Ningbo | 2010-12-30 | 2011-01-01 (10 rows) #
自動検知機能を用いたデータセットの作成(Redshift)
ではまず自動検知機能を用いてRedshiftクラスタへの接続設定を作成する方法から試してみたいと思います。上記紹介エントリの『Amazon QuickSightのAWSリソースへのアクセス許可の管理方法』を参考に、Redshiftクラスタと同じAWSアカウントを用いてAmazon QuickSightを利用開始、アクセス設定を実施しておきます。
Amazon QuickSightの操作に移ります。データセット作成のメニューで[Redshift(Auto-discovered)]を選択。
インスタンスIDの部分でプルダウンを展開してみます。すると、自動検知してくれたクラスタのIDが表示されました。選択します。
その他の設定事項についても必要事項を記入。左下のボタンで接続を確認した後、[Create data source]を押下。
スキーマの選択画面へと進みます。ここは先程作成したテーブルが存在するスキーマを選択。
次にテーブルを選択。
ここはどのようにテーブルデータが格納されたかを確認してみましょう。SPICE取込を選択したままで[Edit/Preview data]を選択。
以下の様に、ちゃんと取り込めている事が確認出来ました。
可視化も以下の様に良い感じで出来ました。
自動検知機能を使わないデータセットの作成(Redshift)
自動検知を用いない場合のRedshiftへの接続(例:別アカウントのAmazon Redshiftクラスタ)についても基本的な操作はさほど変わりません。新規データセット作成の際の接続種別で『Redshift(Manual Connect)』を選択し、
必要事項を全て手入力で埋めるだけです。接続確立後の操作は自動検知機能利用時のものと変わらないので割愛します。
まとめ
という訳で、Amazon Redshiftを用いたAmazon QuickSightデータセットの作成手順に関するご紹介でした。同じく『自動検知機能』を使えるデータソースにRDSがありますが、そちらについては機会があれば別エントリにてご紹介出来ればと思います。こちらからは以上です。